Guide de programmation AMD HIP : Fondements architecturaux de l’écosystème HIP

Le Écosystème HIP est conçu comme une couche d'abstraction mince destinée à assurer la compatibilité du code source entre les architectures AMD et NVIDIA. Il utilise le ROCm (Radeon Open Compute) pile, en particulier en exploitant le Architecture système hétérogène (HSA) runtime et le Pilote de fusion de noyaux (KFD).

1. Initialisation du démarrage

L'initialisation commence par des échanges de poignées de pilotes de noyau de bas niveau via hsa_init(0, ...) et hsaKmtOpenKFD(...). Ces appels d'établissement créent le pont de communication entre les applications en espace utilisateur et le matériel GPU AMD.

2. Découverte de la topologie et des propriétés

Avant de lancer les noyaux, le runtime identifie les capacités matérielles en utilisant hsaKmtAcquireSystemProperties et hsaKmtGetNodeProperties. Il mappe la mémoire physique aux nœuds GPU en utilisant hsaKmtMapMemoryToGPUNodes, garantissant la visibilité de la table de pages pour le périphérique.

3. La chaîne de compilation

Le pont entre CUDA et HIP repose sur deux piliers : hipify-perl (transpilateur basé sur des expressions régulières) et hipcc (enveloppe de compilateur).

# Exemple de workflow de portage
hipify-perl square.cu > square.cpp
hipcc square.cpp -o square.out

4. Logique de versionnage

La compatibilité est assurée par une formule précise afin de garantir que hipRuntimeGetVersion correspond aux tables d’extension HSA :

$$\text{HIP\_VERSION} = \text{MAJOR} \times 10^7 + \text{MINOR} \times 10^5 + \text{PATCH}$$

TERMINALbash — 80x24

> Ready. Click "Run" to execute.

QUESTION 1

Which tool converts CUDA (.cu) files into HIP-ready C++ (.cpp) files via regex mapping?

hipcc

hipify-perl

hsa_init

rocminfo

QUESTION 2

What is the primary purpose of the Kernel Fusion Driver (KFD) in this architecture?

To compile device-side ISA code.

To manage user-space to GPU communication and page table mapping.

To calculate the HIP_VERSION macro.

To provide high-level math intrinsics.

QUESTION 3

Given the formula, what is the value of HIP_VERSION for major version 6, minor 0, and patch 325?

600325

60032500

60000325

60032500 (6*10^7 + 0*10^5 + 325)

QUESTION 4

Which low-level HSA function must be called to establish the system-wide runtime context?

hsa_init(0, ...)

hsaKmtAllocMemory(...)

hsaKmtCreateEvent(...)

hsa_agent_iterate_is_pas(...)

QUESTION 5

What does hsa_system_get_major_extension_table do?

It links HIP API calls to the specific HSA implementation on the host.

It converts CUDA code to C++.

It allocates 4096-byte buffers.

It releases KMT system properties.